home *** CD-ROM | disk | FTP | other *** search
/ BBS in a Box 15 / BBS in a box XV-1.iso / Files / Internet / Info / Internet Roadmap.sit / Internet Roadmap ƒ / Map 16 Ftp File Compression↵ < prev    next >
Encoding:
Text File  |  1995-02-14  |  12.2 KB  |  300 lines  |  [ttro/ttxt]

  1. MAP16: FTP FILE COMPRESSION
  2. ---------------------------
  3.  
  4.      "Travel is glamorous only in retrospect." -- Paul Theroux,
  5.       quoted in The Observer
  6.  
  7.  
  8. Own a personal computer for any amount of time, and you will quickly
  9. realize that the amount of storage space on your computer is limited.
  10. One way to deal with this problem is to use a compression software
  11. package that "squishes" unused programs into small "boxes", thus
  12. freeing up a little more of your disk space for other programs.
  13.  
  14. It turns out that storage space problems are not limited solely to
  15. personal computers. As the numbers of files that are available
  16. through ftp increases daily, ftp sites are actively looking
  17. for ways to squeeze more files into a limited amount of space.
  18.  
  19. The ftp sites accomplish this by using file compression.
  20.  
  21. The good news is that a compressed file takes up a lot less space
  22. on the ftp site's computer. The bad news is that a compressed file
  23. is absolutely useless until you uncompress it.
  24.  
  25. Wait ... it gets worse. Before you can uncompress a file, you have
  26. to know what compression method was used to compress the file in
  27. the first place. Unfortunately, there is no one standard ftp file
  28. compression method -- there are HUNDREDS of different file compression
  29. methods in use today :(
  30.  
  31. If you have to know what compression method was used before you
  32. can uncompress a file, how are you ever going to figure out which
  33. method was used? Well, it is actually pretty easy:
  34.  
  35.      1. Most ftp directories have a READ.ME file that shows an
  36.         index of all the files that are in that directory. Some
  37.         really nice ftp sites have expanded READ.ME files that
  38.         include a mention about what compression method was used
  39.         and where you can get a free copy of the software needed
  40.         to uncompress the files.
  41.  
  42.      2. Look at the files' extensions. By looking at the extensions
  43.         and comparing them to the chart below, you will be able to
  44.         determine what compression method was used and what particular
  45.         software is needed to uncompress the file.
  46.  
  47. Fortunately, most uncompression software is either public domain (meaning
  48. that it is completely free) or shareware (meaning that you can get a copy
  49. of it for free, but the author expects you to send him some money for the
  50. program if you decide to keep it and use it). Best of all, most
  51. uncompression software is available through ftp! :)
  52.  
  53. The list below shows some of the most popular extensions that you
  54. are bound to encounter during your visits to ftp sites around the
  55. world. It also shows transfer modes needed to retrieve files with
  56. these extensions, what uncompress software package you need to
  57. to uncompress the files after you retrieve them, and it even gives
  58. some additional comments about each of the extensions.
  59.  
  60. Paraphrasing something I said in MAP01, I want you to be aware
  61. that the one compression method that isn't listed below is going
  62. to be the one compression package that you ADORE. Please do not
  63. take this personally. There are literally HUNDREDS of compression
  64. methods in use today, and there is no way that I can list all
  65. of them.
  66.  
  67. SUGGESTION: Save the following list, and use it as a reference tool
  68. for when you encounter an extension that you have never seen before :)
  69. Also, please notice that the following list talks about "archie".
  70. Archie is an FTP search tool that we will discuss tomorrow.
  71.  
  72. -----
  73.  
  74. (the following list was adapted from "The EFF's Guide to the Internet"
  75. by Patrick Crispen)
  76.  
  77. FILE           TRANSFER UNCOMPRESS
  78. EXTENSION      MODE     PACKAGE      ADDITIONAL COMMENTS
  79. ------------   ------   ----------   -----------------------------------
  80.  
  81. .txt or .TXT   ASCII                 By itself, this means the file is
  82.                                      a document rather than a program,
  83.                                      and does not need to be uncompressed
  84.  
  85. .ps or .PS     ASCII                 A PostScript document (in Adobe's
  86.                                      page description language). You can
  87.                                      print this file on any PostScript
  88.                                      capable printer or use a previewer,
  89.                                      like GNU project's GhostScript.
  90.  
  91. .doc or .DOC   ASCII                 Another common extension for text
  92.                                      documents. (Be careful, though: .doc
  93.                                      and .DOC extensions are also used for
  94.                                      Microsoft Word documents (which are
  95.                                      Binary files). The duck theory will
  96.                                      help you determine the difference)
  97.                                      No decompression is needed, unless it
  98.                                      is followed by:
  99.  
  100. .Z             Binary   uncompress   This indicates a Unix compression
  101.                                      method. To uncompress type
  102.  
  103.                                           uncompress filename.Z
  104.  
  105.                                      and hit enter at your host system's
  106.                                      command line.
  107.  
  108.                                      u16.zip is an MS-DOS program that
  109.                                      will let you download .Z files and
  110.                                      uncompress them on your own computer.
  111.                                      The Macintosh equivalent program is
  112.                                      called MacCompress (use archie to
  113.                                      find these).
  114.  
  115. .zip or .ZIP   Binary   PKZip or     This indicates the file has been
  116.                         Zip/Unzip    compressed with a common MS-DOS
  117.                                      compression program, known as PKZIP
  118.                                      (use archie to find PKZIP204.EXE).
  119.                                      Many Unix systems will let you un-ZIP
  120.                                      a file with a program called unzip.
  121.  
  122. .gz            Binary   gunzip       A Unix version of ZIP. To uncompress,
  123.                                      type
  124.  
  125.                                           gunzip filename.gz
  126.  
  127.                                      at your host system's command line.
  128.  
  129. .zoo or .ZOO   Binary   zoo          A Unix and MS-DOS compression
  130.                                      format. Use a program called zoo
  131.                                      to uncompress.
  132.  
  133. .shar or .Shar Binary   unshar       Another Unix format. Use unshar
  134.                                      to uncompress.
  135.  
  136. .tar           Binary   tar          Another Unix format, often used
  137.                                      to compress several related files
  138.                                      into one large file. All Unix
  139.                                      systems will have a program called
  140.                                      tar for "un-tarring" such files.
  141.                                      Often, a "tarred" file will also be
  142.                                      be compressed with the gz method,
  143.                                      so you first have to use uncompress
  144.                                      and then tar.
  145.  
  146. .sit or .Sit   Binary   StuffIt      A Macintosh format that requires
  147.                                      the StuffIt program.
  148.  
  149. .ARC           Binary   ARC or       Another MS-DOS format, which
  150.                         ARCE         requires the use of the ARC
  151.                                      or ARCE programs.
  152.  
  153. .LHZ           Binary   LHARC        Another MS-DOS format; requires
  154.                                      the use of LHARC.
  155.  
  156. "A few last words of caution: Check the size of a file before you get
  157. it. The Net moves data at phenomenal rates of speed.  But that 500,000-
  158. byte file that gets transferred to your host system in a few seconds
  159. could take more than an hour or two to download to your computer if
  160. you're using a 2400-baud modem.  Your host system may also have limits on
  161. the amount of bytes you can store online at any one time.  Also, although
  162. it is really extremely unlikely you will ever get a file infected with a
  163. virus, if you plan to do much downloading over the Net, you'd be wise to
  164. invest in a good anti-viral program, just in case." (1)
  165.  
  166.  
  167. FTPMAIL AND BINARY FILES
  168.  
  169. Yesterday, I showed you that it is possible to get get ftp files
  170. using e-mail by sending an e-mail letter to one of the following
  171. addresses
  172.  
  173.           Australia      ftpmail@cs.uow.edu.au
  174.           France         ftpmail@grasp.insa-lyon.fr
  175.           Germany        ftpmail@ftp.uni-stuttgart.de
  176.           Great Britain  ftpmail@doc.ic.ac.uk
  177.           Ireland        ftpmail@ieunet.ie
  178.           Sweden         ftpmail@lth.se
  179.           USA            ftpmail@sunsite.unc.edu
  180.           USA            ftpmail@ftp.uu.net
  181.           USA            ftpmail@decwrl.dec.com
  182.  
  183. with the following commands in the body of your e-mail letter
  184.  
  185.           reply <your Internet address>
  186.           connect <ftp site address>
  187.           <transfer mode>
  188.           chdir <directory>
  189.           get <filename>
  190.           quit
  191.  
  192. Before I introduce you to the new stuff, there are a couple of
  193. things that I want to review with you.
  194.  
  195. First, the
  196.  
  197.           reply <your Internet address>
  198.  
  199. command tells the ftpmail address where you want the file sent.
  200. If you use the example that I gave you yesterday
  201.  
  202.           reply pcrispe1@ua1vm.ua.edu
  203.           connect ftp.sura.net
  204.           ascii
  205.           chdir /pub/articles
  206.           get fall91.issue
  207.           quit
  208.  
  209. without changing the reply address, ftpmail is going to send the
  210. file to *ME*, not to you :)
  211.  
  212. Please remember to change the reply line to include *YOUR*
  213. Internet e-mail address.
  214.  
  215. Also, I did not mention this yesterday, but ftpmail limits
  216. you to only one CHDIR command per letter.
  217.  
  218. Finally, yesterday I asked you to contact you local Internet
  219. service provider to see if they placed any size limits on
  220. file transfers. If they do, there is an additional command
  221. that you need to add to your list of commands
  222.  
  223.           chunksize <size>
  224.  
  225. This command will break the files into chunks that your
  226. system can handle. If your system has a 50,000 character
  227. limit on messages from the Internet, your chunksize
  228. command should be
  229.  
  230.           chunksize 49000
  231.  
  232. (you want to make sure that you set your chunksize below what
  233. your system's limits are). This command will break your file
  234. into 49,000 character chunks, and will then send the chunks
  235. to you :)
  236.  
  237. You already now how to retrieve ASCII text files using ftpmail.
  238. Today, I am going to show you how to retrieve Binary files using
  239. ftpmail.
  240.  
  241. Binary file transfers using ftpmail aren't difficult ... they
  242. just require a few additional steps. Because all e-mail has to
  243. be in ASCII form, ftpmail has to encode your Binary file in
  244. ASCII before it can e-mail the file to you. Once you get the
  245. file, you can then decode the file back into Binary :)
  246.  
  247. Fortunately, there are two ways that ftpmail can encode Binary
  248. files into ASCII. The first way it can do this is through something
  249. called "uuencode." As long as you have a uudecode program -- and
  250. uudecode programs are all over the place (chances are your site
  251. has uudecode stored on its system) -- the whole process is simple.
  252.  
  253. The second encoding type that you can use is called "btoa" (binary
  254. to ascii). Your local Internet service provider will be able to
  255. tell you a little more about btoa.
  256.  
  257. So, to get ASCII files using ftpmail, you would use the following
  258. commands in the body of your letter to the ftpmail address:
  259.  
  260.           reply <your Internet address>
  261.           connect <ftp site address>
  262.           ascii
  263.           chdir <directory>
  264.           chunksize <size>
  265.           get <filname>
  266.  
  267. and to get Binary files using ftpmail, you would use the following
  268. commands in the body of your letter to the ftpmail address:
  269.  
  270.           reply <your Internet address>
  271.           connect <ftp site address>
  272.           <uuencode or btoa>
  273.           chdir <directory>
  274.           <encoding type>
  275.           chunksize <size>
  276.           get <filname>
  277.  
  278. TOMORROW: - ARCHIE
  279.           - A *HUGE* LIST OF FTP SITES THAT YOU CAN VISIT
  280.  
  281. HOMEWORK
  282.  
  283.      Take a break. You've earned it :)
  284.  
  285.  
  286. SOURCES
  287.  
  288. (1) "The EFF's Guide to the Internet", reprinted by permission.
  289.  
  290.  
  291.    PATRICK DOUGLAS CRISPEN    THE VIEWS EXPRESSED IN THIS LETTER DO NOT
  292.     PCRISPE1@UA1VM.UA.EDU      NECESSARILY REPRESENT THE VIEWS OF THE
  293.   THE UNIVERSITY OF ALABAMA      UNIVERSITY OF ALABAMA - TUSCALOOSA
  294.  
  295.       ROADMAP: COPYRIGHT PATRICK CRISPEN 1994. ALL RIGHTS RESERVED.
  296.  
  297.  
  298.  
  299.  
  300.